Exploration des corrélations dans un classifieur - Application au placement d'offres commerciales
نویسندگان
چکیده
Résumé. Cet article présente une nouvelle méthode permettant d’explorer les probabilités délivrées par un modèle prédictif de classification. L’augmentation de la probabilité d’occurrence de l’une des classes du problème étudié est analysée en fonction des variables explicatives prises isolément. La méthode proposée est posée et illustrée dans un cadre général, puis explicitement dédiée au classifieur Bayesien naïf. Son illustration sur les données du challenge PAKDD 2007 montre que ce type d’exploration permet de créer des indicateurs performants d’aide à la vente.
منابع مشابه
Khiops: outil d'apprentissage supervisé automatique pour la fouille de grandes bases de données multi-tables
Résumé. Khiops est un outil d’apprentissage supervisé automatique pour la fouille de grandes bases de données multi-tables. L’importance prédictive des variables est évaluée au moyen de modèles de discrétisation dans le cas numérique et de groupement de valeurs dans le cas catégoriel. Dans le cas d’une base multi-tables, par exemple des clients avec leurs achats, une table d’analyse individus ×...
متن کاملÉtude des corrélations spatio-temporelles des appels mobiles en France
Résumé. Nous proposons dans cet article de présenter une application d’analyse d’une base de données de grande taille issue du secteur des télécommunications. Le problème consiste à segmenter un territoire et caractériser les zones ainsi définies grâce au comportement des habitants en terme de téléphonie mobile. Nous disposons pour cela d’un réseau d’appels inter-antennes construit pendant une ...
متن کاملKhiops : outil de préparation et modélisation des données pour la fouille des grandes bases de données
Résumé. Khiops est un outil de préparation des données et de modélisation pour l’apprentissage supervisé et non supervisé. L’outil permet d’évaluer de façon non paramétrique la corrélation entre tous types de variables dans le cas non supervisé et l’importance prédictive des variables et paires de variables dans le cas de la classification supervisée. Ces évaluations sont effectuées au moyen de...
متن کاملMotifs séquentiels multidimensionnels étoilés
L’extraction de motifs séquentiels est un domaine de la fouille de données permettant de rechercher des corrélations fréquentes entre des valeurs en prenant en compte leur chronologie d’apparition. Dans le contexte du panier de la ménagère, ce type de méthodes permet par exemple l’extraction de règles de la forme 〈(TV,DV D)(magneto numerique)〉, indiquant qu’un nombre suffisamment important (au ...
متن کاملOptimisation directe des poids de modèles dans un prédicteur Bayésien naïf moyenné
Résumé. Le classifieur Bayésien naïf est un outil de classification efficace en pratique pour de nombreux problèmes réels, en dépit de l’hypothèse restrictive d’indépendance des variables conditionnellement à la classe. Récemment, de nouvelles méthodes permettant d’améliorer la performance de ce classifieur ont vu le jour, sur la base à la fois de sélection de variables et de moyennage de modèl...
متن کامل